Na podstawie wykresu można stwierdzić, że dane z tej samej kategorii tj. local/dict/FoFc są skorelowane dodatnio. Porównując jednak wartości z kategorii local i dict widać, że są skorelowane ujemnie.
Ligand o identyfikatorze SO4 jest najbardziej wykorzystywaną cząsteczką w białka.
Rozkłady liczy atomów i elektronów są proporcojnalne. Jeśli ligand ma dużo atomów to również ma dużo elektronów.
Przy niezgodnościach liczby atomów i elektrónów ligandy o stosunkowo niewielkiej liczbie atomów i elektronów mają większe niezgodności.
Przed wykonaniem skryptów należy zainstalować poniższe biblioteki poleceniem: install.packages(“nazwa_biblioteki”)
– dplyr
– knitr
– DT
– ggplot2
– plotly
Kod przetwarzający dane znajduje się w pliku ScriptCleanData.R.
Skrypt ScriptCleanData.R na samym końcu zapisu dane środowiska do pliku.
Tutaj następuje zaczytanie zapisanych w pliku danych.
load(paste(getwd(), "CleanData.RData", sep = "/"))
Kod znajduję się w pliku ScriptCleanData.R.
Kod znajduję się w pliku ScriptCleanData.R.
– liczba wierszy: 525666
– liczba kolumn: 358
columns_names <- colnames(clean_data);
top50 <- head(clean_data %>% group_by(res_name) %>%
summarise(res_name_count = n()) %>%
arrange(desc(res_name_count)),50);
clean_data <- clean_data %>% filter(res_name %in% top50[["res_name"]]);